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“all the world believes ¡it (Gaussian distribution) firmly, because the 


mathematicians imagine that it is a fact of observation, and the observers that i¡t 
is a theorem of mathematics” 


(Lippmann a Poincaré, 1912) 


“todo el mundo cree en ella (la distribución de Gauss) firmemente, porque los 
matemáticos imaginan que está fundamentada en observaciones de hechos, y los 
observadores [imaginan] que es un teorema de los matemáticos” 

(Lippmann a Poincaré, 1912) 


Encyclopedia of Statistical Sciences. Vol 4: Laws of error. 





A. El concepto de DISTRIBUCIÓN se refiere al reparto de los individuos de una 
población según una característica. Supongamos que la característica es el sexo. Si 
en la población hay tantas mujeres como hombres se dice que la distribución de 
sexo en la población es uniforme, y por tanto la probabilidad de que un individuo 
seleccionado al azar sea mujer vale 0,5: 


Uniforme: P(M)=0,5;P(H)=0,5 Suma = 1 
Si el reparto no es uniforme, entonces la probabilidad de que el individuo sea mujer 


valdrá diferente de 0,5, por ejemplo: 
No-uniforme: P (M) = 0,7; P(H) = 0,3 Suma = 1 


DISTR. UNIFORME DISTR. NO-UNIFORME 


l=mujer ¿=hombre 2¿=hombre 





B. Sea como sea el reparto, al final la suma de todas las probabilidades ha de ser 
siempre igual a uno. 


C. Hay que distinguir entre distribución de frecuencias y distribución de 
probabilidad. La primera es un reparto empírico observado en una colección de 
datos. El histograma es una técnica gráfica para representar la distribución de 
frecuencias de una variable continua. 


Una distribución de probabilidad es un reparto teórico de la población y por tanto es 
una función matemática. La representación gráfica será una curva como por 
ejemplo la campana de Gauss. 


D. Definición formal. Una VARIABLE ALEATORIA, (VA), es una función matemática 
que asigna diferentes números reales a cada resultado de una experiencia aleatoria. 
VA: espacio muestral (S) > conj. Reales (R) 


Ejemplo: 
E = “lanzar al aire una moneda 2 veces” 
S = [(c,C); (c,x); (x,C); (x,X)) 
VA = “contar el número de caras” 


_CARA= (C,C) ———> 2 
¿CARA E 


“CRUZ = (C,X) e 
> 1 
_>CARA= (X,C) 


SENUZ= (1 +0 





E. Recorrido de una VA: Conjunto R de todos los valores posibles. En el ejemplo 
anterior R = (0, 1, 2). 


F. La intención al definir una Variable Aleatoria (VA) es poder convertir cualquier 
espacio muestral en un conjunto de números. Esto se puede hacer de distintas 
maneras. Ejemplos: 
e Asignación arbitraria 
E = “lanzar una moneda” 
S = (cara, cruz) 
VA="valor de la cara obtenida: c=0; x=1" 


R= (0,1) 
e Asignación identidad 
E = “lanzar un dado de 6 caras” 


S = (1, 2, 3, 4,5, 6) 
VA= “puntos de la cara” 
R=(1,2,3,4, 5, 6) 
e Asignación por medida 
E = “extraer al azar una persona de una población” 
S = [Pepe, Luís, Marta, Carlos,...... , Ana) 
VA="altura de una persona” 
R = (148,152.5, 167.3,...,190.4) 


G. Tipos de variables aleatorias 
e DISCRETA (“discontinua”). Variable con un conjunto de resultados limitados 
(recorrido finito o infinito numerable). 
X = número de hijos de una mujer 
Y = número de partos en taxis de Barcelona en un año 
e CONTINUA. Variable con un conjunto de resultados ilimitado, es decir, el 
recorrido es infinito. Ejemplos: 
X = la altura de un individuo 
Y = el salario de un trabajador 


H. Una distribución teórica de probabilidad describe el reparto de los valores de una 
variable aleatoria en una población. Los valores que son más abundantes tendrán 
mayor probabilidad de aparecer al realizar la experiencia aleatoria que los valores 
más escasos. 


I. El reparto de probabilidad de una variable discreta se define mediante la 
FUNCIÓN DE PROBABILIDAD que asigna a cada valor posible de la variable aleatoria 
un número p en el intervalo [0,1]: 
FP x=>P(G)=p si x está en el recorrido 
x > P(x) =0 si el valor x no está recorrido 


Dos propiedades importantes: 


e Los valores p son siempre positivos o nulos: p=0 
e La suma de todas las p's ha de ser igual a uno: 2p =1 
Ejemplo: 
E = “lanzar al aire una moneda 2 veces” 


S = £(c,c); (C,x); (x,C); (x,x)) 
VA = X= “contar el número de caras” 


(0,0) > 2 > P(2)=1/4 


(C,X) a 20 A A, 
> 1 ——> P(1)=2/4 7 


y 
le 
q 
E 
E 
a 
a 
—_ 
eL 


(X, C) [ 


(XX) > 0 ——=> P(0)=1/4 , 


Número de caras 





J. En las variables aleatorias continuas no se puede usar la función de probabilidad 
porque la probabilidad en un punto x, sea cual sea, es siempre cero: 
P(X=x) = 0 


En consecuencia en variables continuas sólo tiene sentido hablar de probabilidad 
referida a intervalos, que pueden ser muy pequeños: 


P(XEla, bl) 4 0; siendo a y b números reales cualesquiera 


K. Para explicar el reparto de probabilidad de una variable continua se utiliza la 
FUNCIÓN DE DENSIDAD DE PROBABILIDAD (f) que es una curva continua con las 
siguientes propiedades: 


e En cualquier punto de la recta real la función es positiva o cero: 
0 

e El área total bajo la curva de f vale uno: 
Area total =1 


L. Existen muchas curvas que cumplen los criterios para ser función de densidad, 
por ejemplo las siguientes: 


uniforme no-uniforne simétrica no-uniforme asimétrica 





M. La función de densidad de probabilidad servirá para calcular la probabilidad en 
un intervalo calculando el área contenida en dicho intervalo. 


(a,b) =(-0, 0.4) (a,b) =(0.6, 1.0) (a,b) =(1.0, +00) 





Principales Distribuciones de probabilidad. 


A. El modelo BINOMIAL explica el reparto de probabilidad de los resultados que se 
pueden observar al realizar una experiencia aleatoria del tipo: 
E = “repetir n veces un ensayo con resultado dicotómico” 


y la variable aleatoria es el recuento de los éxitos 


X = "número de éxitos en n repeticiones del ensayo” 
R =(0,1...,n)? 


Ejemplo 
E = “escoger al azar 3 persona de un grupo” 6 > éxito = “ser zurdo” 
S = £(d, d, d); (d, d, z); (d, z, d); (z, d, d); (d, z, z); (z, d, 2); (Z, z, d); (z, z, z)) 
X = "número de zurdos en 3 personas escogidas al azar” 
R=(0, 1, 2, 3) 


Para decir que una variable aleatoria X sigue una distribución de probabilidad 
Binomial se utiliza la expresión: 


X — B (n,p) 


siendo n y p los dos parámetros del modelo: 
n = número de repeticiones 


p = probabilidad de éxito (1-p= q =probabilidad de fracaso) 


La forma de la función de probabilidad dependerá de los valores de los parámetros. 
El número de barras es igual a (n+1) y por tanto a mayor n más bajas son las 
barras. 


La simetría del conjunto sólo ocurre para p=0.5, mientras que para cualquier otro 
valor de p el reparto es asimétrico. 


B (n=3, p=0.5) B (n=6, p=0.2) 
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B. El modelo de POISSON explica el reparto de probabilidad de una variable 
aleatoria 


que se ajuste a una expresión del tipo: 


X = "número de acontecimientos raros en un intervalo de tiempo o espacio” 
R=(0,1..., o) 


En esencia, se trata de un recuento sin límite superior de resultados con una 
probabilidad muy baja. 


Ejemplos 
- número mujeres que dan a luz durante un vuelo de avión en un año 
- número de nuevos casos de cáncer de mama en varones en una región 


Para decir que una variable aleatoria X sigue una distribución de probabilidad 
Poisson se utiliza la expresión: 


X — P (lambda) 
siendo lambda ( A) el único parámetro de la distribución 
La forma de la función de probabilidad dependerá sólo del valor lambda. 


Teóricamente el recorrido de la variable acaba en infinito por eso el número de 
barras es siempre ilimitado. 


Poisson (lambda =1) Poisson (lambda =4) 
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C. La distribución NORMAL es un objeto matemático. Fue la solución encontrada 
por A. de Moivre para aproximar cálculos de probabilidad en juegos de azar a 
principios del siglo XVIII. Posteriormente fue empleada para explicar los errores de 
medida en física y astronomía. Galileo ya había razonado que los errores de 


observación se distribuían simétricamente y tendían a agregarse en torno a su valor 
real. 


K.F. Gauss la utilizó en un trabajo que publicó en 1809 y su nombre acabó 
identificando la distribución porque la usó a menudo cuando analizaba datos 
astronómicos. El protagonismo de esta distribución en las ciencias de la vida se 
debe al desarrollo de la Biometría. Hacia finales del siglo XIX se generalizó el uso de 


esta distribución de probabilidad para justificar la distribución de frecuencias de 
características biológicas. 


Histograma Campana de Gauss 
Distribución de frecuencias Distribución de masa de probabilidad 
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La campana de Gauss es la representación gráfica de la función de densidad, f, del 
modelo Normal. 


Los parámetros del modelo son uy y o. El primero, yu, es la esperanza de X y decide 
la posición de la campana a los largo del eje horizontal. El segundo, o, es la raíz 


cuadrada de la variancia X y determina la anchura de la campana. 


Parámetros de la distribución normal: (u, 0) 


-—p:=3, dt=1 ——m=6, dt=1 ——=m=6, dt=D.5 
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Características de la densidad normal 
- por definición de densidad, el área total bajo la curva vale 1. 
- la curva presenta un pico (máximo) en el centro, cuya altura puede ser mayor 
que 1 si la desviación típica es muy pequeña. 
- la curva es simétrica respecto al eje vertical que pasa por el centro. 
- la media, mediana y moda coinciden en el mismo punto. 
- la función tiene dos puntos de inflexión en las abscisas (1-10) y (u+10) 
respectivamente, con lo cual la desviación típica es la distancia desde el eje 
central a los puntos de inflexión. 
- las colas son infinitas, es decir, la curva toca el eje X en -o y +00, 
- Cualquier campana de Gauss cumple siempre las siguientes proporciones: 
área entre (1-10) y (u+10) = 68% 
área entre (1-20) y (u+20) = 95% 
área entre (1-30) y (u+30) = 99% 


